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摘 要 : 时 效 性 是 衡量 新 闻 的 决定 性 标尺 ， 它 要 求 新 闻 媒 体 在 新 闻 发 生 时 要 用 最 快 的 速度 对 新 闻 事 件 进 行 真实 、 准 确 地 报道 。 
为 了 能 够 在 日 趋 激烈 的 新 闻 竞 争 中 处 于 不 败 之 地 ， 新 闻 机 构 广 泛 利 用 人 工 智 能 技术 ， 特 别 是 自然 语言 处 理 技术 ， 力 图 实现 新 
闻 制 作 自 动 化 。 本 文 主要 介绍 新 闻 媒 体 利用 自然 语言 处 理 技术 实现 新 闻 自 动 化 的 两 个 案例 ， 并 探讨 新 华 社 北美 总 分 社 在 自然 
语言 处 理 技术 当前 应 用 的 情况 ， 对 未 来 发 展 提出 了 的 一 些 建 议 。 
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S 导语 础 上 ,项 目 组 对 新 闻 制 作 流程 进行 了 分 解 。 中 

CD 随 着 大 数据 、 人 工 智能 技术 的 发 展 ， 新 闻 行 业 迎 来 项 目 组 首先 利用 自然 语言 处 理 技术 中 相对 成 熟 的 “ 命 
二 了 历史 性 的 变革 。 新 闻 机 构 利用 人 工 智能 和 大 数据 技术 。 名 实体 识别 (NER ) ”技术 来 鉴别 文字 稿件 中 的 关键 实 
名 不 断 推动 新 闻 业态 的 发 展 。 从 写 稿 机 器 人 到 个 性 化 新 闻 。 体 信息 ; 再 将 算法 识别 出 来 的 实体 信息 作为 参数 ， 调 取 
加 推荐 ， 新 技术 给 新 闻 业 注入 了 新 的 能 量 。 图 片 检索 技术 查找 适合 的 漫画 素材 ， 通 过 预制 的 模板 将 
© 特别 是 在 自然 语言 处 理 ( NLP ) 技术 领域 ， 新 闻 媒体 ”文字 新 闻 和 漫画 背景 泻 染 成 一 幅 漫画 。 这 个 原型 服务 通 
本 。 在 这 方面 进行 了 较 多 的 探索 。 比 如 ，NLP 技术 对 众 包 的 数 ”过 网 页 应 用 的 形式 开放 给 编辑 使 用 。 编 辑 通过 该 网 页 应 
SS 据 进行 清洗 和 预 处 理 。 或 在 新 闻 编辑 环节 使 用 自然 言语 生 用， 可 以 将 精力 集中 于 文字 编辑 ， 系 统 后 台 完 成 漫画 搜 
@ 成 (CNLG ) 技术 优化 新 闻 制作 ;使 用 推荐 算法 个 性 化 新 闻 索 和 模板 泻 染 的 工作 ， 并 将 最 终结 果 呈现 给 编辑 ， 供 纺 
CN 推送 ; 或 使 用 聊天 机 器 人 ( chat bot ) 与 用 户 的 实时 互动 。 。 辑 做 进一步 的 调整 和 完善 。 

~> 1. 自动 化 图 表 新 闻 根据 项 目 一 期 的 效果 ， 项 目 组 启动 了 第 二 阶段 的 实 
又 根据 相关 新 闻 机 构 的 调查 发 现 ， 年 轻 读者 一 方面 对 ” 验 ， 仍然 是 6 周 时 间 。 这 一 阶段 ， 项 目 组 着 重 解决 漫画 
(5 ”涉及 公共 服务 且 具 有 重要 价值 的 新 闻 故事 表现 出 浓厚 的 兴 ”自动 化 生成 的 准确 度 和 效率 问题 。 为 此 项 目 组 设计 了 一 
所 趣 ， 另 一 方面 ， 对 采用 大 段 文字 叙事 的 新 闻 则 缺少 耐心 逐 套 自然 语言 处 理 的 流水 线 ， 并 对 NER 信息 提取 的 算法 进 
人 。 段 阅 读 。 为 此 ， 国 外 新 闻 机 构 希 望 通 过 采用 漫画 + 文字 的 。 行 了 改进 。 

〇 ”形式 来 发 布 新 闻 信息 ， 通 过 此 形式 吸引 更 多 的 读者 。 由 于 该 系统 主要 利用 NER 技术 来 解析 新 闻 稿件 中 的 


虽然 图 表 、 漫 画 新 闻 表现 形式 并 非 首 创 ， 在 新 华 社 关键 信息 ， 此 环节 的 准确 程度 决定 了 后 续 漫画 模板 的 选 
摄影 新 闻 报 道中 已 经 是 普遍 采用 的 一 种 新 闻 形 式 。 但 图 。 择 是 否 准确 合理 。 为 了 使 第 一 步 关 键 信息 提取 更 加 准确 ， 
表 新 闻 的 制作 过 程 对 编辑 仍 存在 不 小 的 技术 挑战 : 比如 ， 项 目 组 尝试 了 多 种 方式 ,包括 提取 一 组 相关 的 实体 信息 
如 何 快速 、 准 确 的 挑选 适合 新 闻 主 题 的 素材 ; 如 何 将 各 。 名 ， 让 记者 选择 最 相关 的 关键 字 并 保留 下 来 作为 图 片 检 
种 矢量 图 片 组 合并 制作 成 最 终 的 漫画 模板 。 上 述 这 些 工 。 索 的 参数 。 还 尝试 直接 允许 编辑 输入 关键 字 。 

作 ， 即 使 对 经 验 丰 富 的 编辑 也 是 一 项 费时 的 工作 。 能 否 为 了 试图 让 系统 自动 挑选 出 最 适合 的 图 片 作为 漫画 
将 图 表 新 闻 通 过 计算 机 自动 完成 ， 提 高 新 闻 制作 效率 ， 新 闻 素 材 ， 项 目 组 根据 医疗 健康 新 闻 特 点 ， 设 计 了 一 套 
减轻 编辑 的 工作 压力 ， 就 成 为 自动 化 图 表 新 闻 主 要 解决 规则。 比如， 如 果 在 文字 稿件 中 检测 到 数字 信息 ， 系 统 
的 问题 。 会 生成 一 个 简单 的 数据 可 视 化 图 ; 如 果 编 辑 输入 了 引言 ， 

有 新 闻 媒体 曾 启 动 了 为 期 6 个 月 的 一 项 实验 , 实验 。 系统 会 将 引言 自动 添加 到 图 片 对 话 框 ， 并 标注 被 引用 者 

的 主要 目的 就 是 尝试 通过 计算 机 自动 制作 图 表 新 闻 。 第 的 信息 。 
一 期 实验 为 期 6 周 ， 主 要 是 验证 技术 可 行 性 。 据 介绍 ， 然而 ， 在 这 一 阶段 的 实验 中 ， 项 目 组 发 现 理想 与 现 
为 了 降低 项 目 复杂 度 ， 项 目 组 将 问题 聚焦 在 公共 健康 方 ” 实 的 差距 ， 比 如 : 医学 领域 经 常会 发 布 一 些 有 关 疑 难 疾 
面 的 新 闻 ， 主 要 因为 该 类 新 闻 大 多 具有 相似 的 结构 ,多 ” 病 的 创新 疗法 ， 此 时 利用 自动 化 的 系统 很 难 将 NER 信息 
数 内 容 是 关于 医学 方面 的 新 发 现 或 新 疗法 。 他 们 首先 了 给 出 对 应 的 漫画 素材 相映 射 , 找到 合适 素材 或 模板 。 为 此 ， 
解 公共 健康 新 闻 的 结构 、 重 要 的 新 闻 构 成 要 素 。 在 此 基 ”项 目 组 邀请 认 知 科学 家 、 漫 画 理 论 家 共同 参与 设计 新 闻 


由 


202310.00423V1 


chinaXiv 


模板 ， 利 用 更 加 通用 的 漫画 模板 尽量 完善 系统 自动 化 流 
程 。 

2020 年 10 月 ,项目 组 使 用 该 系统 制作 了 一 条 有 关 
新 冠 疫 情 的 新 闻 ， 并 发 布 在 脸 书 和 Instagram 的 “限时 动 
态 ” 中 。 目 前 该 原型 产品 已 经 应 用 在 媒体 内 部 的 健康 新 
闻 小 组 。 利用 该 系统 , 编辑 仅 专 注 于 完成 文字 编写 工作 ， 
系统 完成 新 闻 主 题 的 识别 ， 根 据 识别 出 的 主题 搜索 恰当 
的 漫画 模板 ， 并 进行 合成 演 染 。 
2. 利用 聊天 机 器 人 发 布 新 冠 疫情 信息 
新 冠 疫情 在 很 大 程度 上 改变 了 人 们 生活 、 工 作 的 方 
式 。 特 别 是 在 2020 年 疫情 期 间 ， 对 病毒 的 恐惧 ， 迫 使 人 
们 不 得 不 选择 大 部 分 时 间 居 家 办 公 。 与 此 同时 ， 铺 天 盖 
地 的 虚假 新 闻 和 错误 的 信息 ， 也 使 人 们 变 得 无 所 适 从 。 

对 于 媒体 来 说 ， 让 受众 在 第 一 时 间 获 取 到 真实 、 可 
靠 的 信息 ， 自 然 成 为 新 闻 机 构 追 求 的 首要 目标 。 特 别 是 
在 疫情 肆虐 的 时 期 ， 人 们 对 各 种 资源 的 需求 更 加 迫切 。 
为 用 户 提 供 一 条 畅通 且 可 靠 的 疫情 信息 播报 通道 ， 也 就 
成 为 各 新 闻 机 构 要 解决 的 一 个 重要 问题 。 

另外 ， 随 着 社交 媒体 平台 的 不 断 发 展 ， 像 微 信 、 微 
博 已 经 成 为 新 闻 消 费 者 的 重要 社交 网 络 平台 。 据 路 透 社 
的 一 个 统计 报告 ， 在 2018 年 至 2020 年 期 间 ， 大 约 有 1/3 
的 国外 用 户 通 过 脸 书 获取 新 闻 ， 部 分 国家 甚至 更 高 。 社 
交 媒 体 成 为 人 们 获取 新 闻 的 主要 途径 。™ 

正 因为 社交 媒体 在 新 闻 传播 方面 的 巨大 影响 力 ， 有 
媒体 选择 尝试 将 聊天 机 器 人 与 脸 书 的 聊天 应 用 ( Facebook 
Messenger ) 相 结合 ， 发 布 新 闻 信 息 。 一 方面 ,疫情 期 间 ， 
记者 可 以 在 家 方便 地 更 新 相关 信息 ; 另 一 方面 ， 随 着 人 
工 智能 技术 的 进步 , 聊天 机 器 人 解决 方案 也 已 成 熟 ; 而且， 
根据 脸 书 的 统计 ， 脸 书 的 聊天 客户 端 在 疫情 开始 阶段 的 
使 用 频率 呈现 爆发 式 增长 。 基 于 上 述 原因 ， 将 聊天 机 器 
人 chat bot ) 集成 到 脸 书 的 聊天 应 用 程序 ， 或 许 是 个 不 
错 的 实践 。 

该 新 闻 机 构 尝 试 使 用 一 款 名 为 “ 德 克 斯 特 ”( Dexter ) 
的 第 三 方 工具 作为 聊天 机 器 人 的 引擎 。 借 助 脸 书 的 
Messenger 应 用 通道 ， 记 者 除了 发 布 最 新 的 疫情 感染 数字 
以 及 相关 的 封 城 措施 外 ， 同 时 推送 其 他 附加 内 容 ， 以 防 
止 人 们 错过 重要 的 新 闻 资 讯 。 机 器 人 可 与 用 户 进行 实时 
互动 ,根据 用 户 输 入 的 内 容 ， 为 用 户 提供 相关 的 视频 新 
闻 或 有 关 医 护 工作 人 员 那 些 振奋 人 心 的 感人 事迹 。"” 

该 新 闻 机 构 首 先 在 东南 亚 部 署 了 测试 版 程序 ， 用 于 
获取 用 户 和 机 器 人 的 交互 情况 。 三 周 后 ， 项 目 组 增加 了 
订阅 功能 ， 人 允许 系统 自动 推送 信息 。 根 据 项 目 组 收集 到 
的 数据 显示 : 大 约 1/3 曾 与 机 器 人 交互 过 的 用 户 选择 订阅 
该 服务 。 该 项 目 在 越南 和 和 孟加拉 两 个 国家 进行 了 部 署 ， 
这 两 地 的 新 闻 团 队 负 责 每 天 更 新 最 新 的 疫情 数据 。 这 两 
组 机 器 人 总 计 收 发 大 约 一 百 万 条 交互 信息 。 这 一 交互 数 
量 远 高 于 项 目 组 的 预期 。 


ChinaXiv 合 作 期 刊 


传媒 技术 | 43 有 


根据 用 户 与 聊天 机 器 人 的 交互 情况 ， 项 目 组 发 现 : 
当 新 闻 发 布 机 构 自 动 推送 的 消息 对 用 户 来 说 是 重要 话题 
时 ， 用 户 的 订阅 意愿 十 分 强烈 。 另 外 ， 脸 书 的 收 件 箱 是 
一 个 未 被 充分 利用 的 空间 ， 特 别 是 对 于 聊天 机 器 人 等 智 
能 化 交互 ， 这 一 通道 是 一 个 成 熟 交 互 途 径 ， 也 是 可 以 充 
分 开发 的 交互 方式 。 但 同时 ， 如 何 让 用 户 发 现 聊天 机 器 
人 这 一 功能 ， 确 实 是 一 个 挑战 。 目 前 项 目 组 使 用 的 方法 
就 是 通过 广告 宣传 ， 通 过 在 各 种 渠道 宣传 ， 让 用 户 知 道 
并 发 现 这 个 服务 。 另 外 ,在 2020 年 的 秋天 ， 该 新 闻 机 构 
尝试 在 美国 大 选 期 间 利用 机 器 人 推送 相关 消息 ， 并 与 用 
户 互动 ， 提 供 详 细 的 选 情报 道 ， 采 用 的 也 是 类 似 的 解决 
方案 。 

3. 对 新 闻 行 业 技术 创新 的 启示 

上 述 两 个 项 目 是 国外 新 闻 机 构 将 人 工 智 能 技术 与 新 
闻 生 产 和 传播 相 结合 的 典型 案例 ， 这 其 中 既 有 利用 计算 
机 辅助 编辑 、 记 者 提高 新 闻 播 发 效率 ; 也 有 通过 新 技术 
增强 与 用 户 互动 ， 获 取 用 户 行 为 数据 ， 进 一 步 指 导 新 闻 
编发 工作 。 

笔者 所 在 单位 ， 在 人 工 智能 应 用 方面 进行 了 一 些 探 
索 ， 诸 如 在 编辑 部 使 用 的 新 一 代 采 编 系 统 中 者 括 了 诸多 
人 工 智 能 工具 ， 比 如 : 智能 检 校 、 语 音 识 别 、 智 能 辅助 
翻译 、 图 片 文字 识别 等 ， 都 是 利用 自然 语言 处 理 技 术 实 
现 工作 的 自动 化 。 这 些 实践 在 实际 工作 中 已 经 发 挥 了 重 
要 的 作用 ， 有 效 提 高 了 新 闻 制 作 效率 ， 节 约 了 时 间 ， 获 
得 编辑 、 记 者 的 好 评 。 有 记者 反馈 ,利用 语音 识别 工具 ， 
可 极 大 提高 采访 素材 处 理 效 率 ， 原 来 需要 几 个 小 时 才能 
处 理 完成 的 文字 素材 ， 可 通过 AI 工具 在 几 分 钟 内 即 可 完 
成 初 加 工 ， 记 者 可 以 将 更 多 的 精力 投入 到 深度 内 容 的 挖 
掘 中 。 

由 此 可 见 ， 人 工 智能 技术 能 够 有 效 提 升 新 闻 制 作 效 
率 ， 因 此 应 该 充分 利用 这 一 技术 优势 ， 将 人 工 智能 技术 
与 新 闻 制 作 、 传 播 更 多 的 进行 融合 。 根 据 不 同 的 应 用 场 
景 或 新 闻 形 式 ， 设 计 相 应 的 新 闻 制 作 工 作 流 引 擎 ， 将 原 
始 素材 的 初 加 工 、 查 询 工 作 自 动 化 ， 让 编辑 将 更 多 的 精 
力 放 在 新 闻 故 事 的 创作 上 。 让 新 闻 采 编 工 作 全 流程 进入 
智能 化 、 自 动 化 的 快车 道 。 

其 次 ， 随 着 技术 不 断 进 步 ， 新闻 行业 也 正在 经 历 翻 
天 履 地 的 变革 ， 各 种 创新 层出不穷 。 新 华 社 作为 国家 通 
讯 社 ， 如 何 履 行 好 党 中 央 “ 喉 天”“ 耳 目 ” 职 能 ， 发 挥 
正确 引导 国内 积 论 、 积 极 影 响 国际 与 论 的 重要 作用 ， 是 
新 闻 工 作者 同样 也 是 技术 创新 的 初 心 和 使 命 。 与 此 同时 ， 
也 不 能 忽视 的 是 在 当下 这 个 时 代 ， 新 闻 创 新 可 能 不 再 是 
开创 单一 的 传播 渠道 ， 而 是 以 为 多 样 化 的 受众 提供 真正 
有 价值 的 数字 新 闻 体 验 为 目标 。 数 字 媒 体 生 态 系统 的 加 
速 变化 要 求 新 闻 从 业者 改变 传统 的 制作 、 分 发 和 传播 新 
闻 的 方式 。 如 何在 完成 国家 通讯 社 的 职能 和 使 命 的 同时 ， 
为 多 样 的 用 户 提供 个 性 化 的 新 闻 产品 ， 也 是 我 社 面临 的 
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